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中 文摘 要 


摘要 : 多 重 分 形 是 非 线 性 科学 研究 中 十 分 活路 的 一 个 新 分 支 , 现在 已 被 广泛 应 用 
于 各 个 学 科 领 域 , 本 文 主要 利用 多 重 分 形 的 有 关 方 法 来 研究 金融 时 间 序 列 , 首先 
用 多 种 方法 (EW, 统计 矩 、 多 重 分 形 谱 等 ) 对 香港 恒生 指数 收盘 价 序列 进行 了 多 
重 分 形 分 析 ， 得 出 收益 率 序列 具有 较 弱 得 多 重 分 形 性 质 . 在 此 基础 上 , 根据 配 分 
函数 拟 合 直线 斜率 的 大 小 和 多 重 分 形 谱 的 宽度 对 收益 率 序列 进行 分 类 ,通过 配 分 
函数 类 , 我 们 能 够 识别 哪 一 部 分 短 时 数据 具有 分 形 (或 多 重 分 形 ) 性 质 ; 通过 对 多 
重 分 形 谱 进 行 分 类 , 能 够 知道 这 一 短 时 数据 的 复杂 程度 . 然后 ， 用 多 重 分 形 消除 
趋势 涨 落 分 析 方法 ,来 研究 美国 股票 市 场 上 的 沃尔玛 股票 日 收盘 价 指数 (WMT) 
的 多 重 分 形 类 型 , 首次 在 实例 中 给 出 确定 两 种 类 型 多 重 分 形 的 方法 . 这 些 结论 对 
于 用 多 重 分 形 模型 做 金融 时 间 序 列 的 短 时 预测 具有 一 定 的 指导 意义 . 最 后 在 分 形 
理论 的 基础 上 , 结合 相 空间 重 构 的 知识 对 短 时 交通 流 时 间 序列 进行 混沌 预测 ， 取 
得 了 较为 满意 的 效果 ， 
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ABSTRACT 


ABSTRACT: Multifractality is a new branch of nonlinear science and has been 
used in the other fields of science more and more widely. In this paper, we study 
the behavior of the financial time series with the help of multifractal tools. we 
first dealt with time series of the daily Hang Seng index (HSI) in Hang Kong stock 
market, and several techniques such as partition function, generalized dimension 
function and multifractal spectrum are employed in studying the stock market to 
display the degree of multifractality in the time series. We then study the classifi- 
cation of HSI data with the help of partition function and multifractal spectrum. 
From the classes of partition function, we can recognize which short period data 
is multifractal or monofractal, and from the classes of multifractal spectrum, we 
can know the degree of complex in the short periods data. Then The time series 
of daily closing prices of Wal-Mart (WMT) at theAmerican Stock Exchange is an- 
alyzed by Multifractal Detrended Fluctuation Analysis(MF-DFA). We distinguish 
multifractality due to long-range correlations from multifractality due to a broad 
probability density function in the stock market for the first time. At last, ac- 
cording to the phase space reconstruction technology based on the fractal theory, 
the chaos prediction of short-term traffic flow time series are studied. Case study 
using real data proves the validity of the method. 


KEYWORDS: Multifractal; Time series; Stock market; DFA; Phase space re- 
construction 
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11 研究 背景 及 意义 


资本 市 场 是 人 类 的 创造 物 , 但 是 人 类 还 不 知道 它 是 如 何 运行 的 ,是 有 序 的 还 
是 混乱 的 ? 是 线性 的 还 是 非 线性 的 ? 是 可 预测 的 还 是 不 可 预测 的 ? 自古 至 今 , 人 们 
一 直 在 为 寻找 对 资本 市 场 行为 做 出 解释 的 理论 和 模型 进行 着 艰苦 的 探索 . 最 早 对 
资本 市 场 价格 行为 的 研究 ， 可 追溯 到 Louis Bachelier (1900)， 他 率先 将 随机 游 走 
的 理论 与 方法 应 用 到 商品 价格 行为 的 研究 . 随机 游 走 理 论 (Random Walk Theory, 
简 记 为 RWT) WA, 资产 价格 的 变动 是 独立 、 随 机、 不 可 预测 的 , 然而 ， 越 来 越 
多 的 迹象 表明 , 资本 市 场 行为 并 不 符合 随机 游 走 理论 . 20 世纪 90 年 代 , Edgar E 
Peters 提出 分 形 市 场 理论 (Fractal Market Theory, 简 记 为 FMT), 该 理论 认为 , 资 
本 市 场 是 由 大 量 的 具有 不 同 投资 期 限 的 投资 者 组 成 , 信息 对 各 种 不 同 投资 者 的 交 
易 时 间 有 着 不 同 的 影响 . 资产 价格 的 变动 不 是 随机 游 动 ,而 是 具有 增强 趋势 的 持 
AE. 分 形 市 场 理 论 的 提出 尽管 使 得 理解 市 场 和 经 济 的 问题 变 得 复杂 得 多 , 但 是 
也 现实 得 多 , 更 加 符合 金融 市 场 的 实际 特征 . 


近年 来 ， 非 线性 动 广 学、 混沌 理论 、 分 形 理论 等 非 线 性 理论 和 方法 广泛 应 用 
于 金融 市 场 问题 的 研究 , 金融 市 场 本 质 上 是 一 个 非 线性 的 动力 系统 , 大 多 是 以 非 
线性 方式 对 外 界 作用 起 反应 的 ， 在 现实 经 济 系统 中 , 非 线性 是 很 普遍 的 . 金融 市 
场 价格 的 波动 ， 可 以 根据 Mandelbrot 在 分 形 几何 中 的 研究 中 推导 出 的 模型 加 以 
解释 , 分 形 经 过 进一步 的 发 展 , 出 现 多 重 分 形 ,其 目的 并 不 是 要 确切 地 预测 未 来 ， 
而 是 对 市 场 的 风险 作出 更 切合 实际 的 描述 ， 


长 期 以 来 ,由 于 受 欧 几 里 德 几何 学 及 纯粹 数学 方法 的 影响 ,对 复杂 的 研究 对 
象 习 惯 于 进行 简单 化 和 抽象 ,建立 起 各 种 理想 模型 ( 绝 大 数 是 线性 的 )， 把 问题 纳 
入 可 以 解决 的 范畴 ,当然 用 线性 近似 处 理 的 方法 有 时 也 是 很 有 效 的 , 解决 了 许多 
理论 问题 与 实际 问题 , 推动 了 自然 科学 的 发 展 . 但 是 在 复杂 的 动力 系统 中 , 简单 的 
线性 近似 方法 不 可 能 认识 与 非 线 性 有 关 的 特性 , 如 潢 流 、 对 流 等 . 从 数学 上 看 , B 
然 利用 线性 近似 可 以 对 一 些 非 线 性 系统 列 出 微分 方程 (组 ) ROE, 但 是 除了 
少数 的 例子 可 以 在 一 定 的 条 件 下 求 出 其 特 解 外 , 大 多 数 方程 至 今 仍 解 不 出 来 . 对 
复杂 一 些 的 非 线 性 复杂 系统 与 方程 , 则 连 微分 方程 (组 ) 也 难 列 出 来 . 而 分 形 则 是 
直接 从 非 线性 复杂 系统 的 本 身 入 手 ,去 认识 其 内 在 的 规律 性 ， 从 未 经 过 简化 和 抽 
象 处 理 . 这 一 点 是 分 形 理论 研究 与 非 线性 近似 处 理 方法 本 质 上 的 区 别 ， 


在 金融 市 场 , 线性 模型 技术 常常 由 于 分 解 理论 的 推动 而 采用 ,此 理论 认为 一 
个 随机 过 程 可 以 分 解 成 自 回归 过 程 和 噪音 过 程 . 金融 市 场 中 的 标 度 不 变性 是 市 场 
中 的 一 个 重要 特征 , 而 这 种 特征 在 传统 的 金融 学 理论 中 没有 得 到 应 有 的 重视 ， 标 
度 行为 反映 了 市 场 价格 中 变化 的 相似 性 和 相关 性 , 这 种 相似 性 和 相关 性 体现 在 不 
同 的 时 间 标 度 上 . 标 度 不 变性 改变 了 金融 理论 的 传统 研究 方法 ， 要 求人 们 在 不 同 
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的 时 间 标 度 上 考虑 整个 金融 市 场 的 行为 . 金融 市 场 的 多 重 或 多 标 度 分 形 理论 ,是 
一 个 具有 更 大 理论 和 实际 意义 的 研究 领域 , 它 要 求 对 金融 市 场 的 波动 进行 更 细致 
的 分 解 , 分 析 不 同 波动 规模 (风险 ) 的 不 同 标 度 关系 , 这 种 标 度 关系 的 不 同 说 明了 
不 同 波动 程度 的 相关 性 不 一 样 , 对 不 同 的 风险 , 要 求 采取 不 同 的 风险 管理 措施 . 


多 重 分 形 自 前 在 非 线 性 物理 ,地球 物理 及 经 济 物理 等 方面 得 到 了 广泛 的 应 用 ， 
它们 被 用 来 解释 已 记录 数据 的 标 度 不 变性 , 现实 的 金融 市 场 ， 既 不 象 传统 理论 所 
描述 的 那样 大 幅 波动 的 概率 儿 乎 为 零 , 也 不 象 单 标 度 行为 所 描述 的 那样 大 幅 波 动 
与 小 幅 波动 完全 相似 ， 而 是 采用 多 标 度 关系 对 其 进行 描述 . 多 重 分 形 不 但 能 复 现 
证 券 理 论 描述 的 稳定 市 场所 特有 的 模式 , 而 且 能 复 现 最 近 几 个 月 中 剧烈 震荡 的 金 
融 交 易 状况 ,可 显示 市 场 活动 是 如 何 加 速度 及 放 慢 的 , 即 显示 市 场 易 变性 的 实质 ， 
易 变 性 远 非 是 一 种 可 以 忽略 不 顾 或 轻易 补偿 的 静态 实体 ， 而 是 金融 市 场所 发 生 的 
过 程 核心 . 通过 利用 多 重 分 形 分 析 股价 行为 特征 , 把 握 其 变化 规律 , 提供 关于 市 场 
动向 的 概率 的 估计 值 ， 以 便 人 们 对 可 能 发 生 的 重大 变化 给 予 高 度 重视 . 同时 能 为 
今后 的 经 济 和 金融 政策 的 制定 、 衍 生 工具 的 定价 、 资金 正常 而 高 效 的 运作 、 规 避 
国际 资本 的 干预 和 冲击 带 来 的 风险 等 方面 提供 理论 依据 及 切实 可 行 的 解决 方案 . 


1.2 论文 体系 框架 和 主要 内 容 


本 文 共 分 五 章 ， 


第 一 章 , 绪论 部 分 ， 简 要 介绍 了 多 重 分 形 在 金融 时 间 序 列 研究 中 的 背景 及 意 
义 , 列 出 了 论文 的 大 致 体系 框架 和 主要 内 容 . 


第 二 章 , 回顾 分 形 理论 的 创立 、 RR. 意义 及 分 形 的 性 质 , 并 介绍 多 重 分 形 的 
一 般 理论 及 性 质 ， 


第 三 章 ， 首 先 对 香港 恒生 指数 的 日 收盘 价 序列 进行 多 重 分 形 分 析 ; 然后 利用 
多 重 分 形 谱 和 配 分 函数 ， 把 香港 恒生 指数 的 日 收盘 价 序列 分 别 按 多 重 分 形 谱 的 宽 
度 和 配 分 函数 拟 合 直线 斜率 的 大 小 进行 分 类 , 更 进一步 的 研究 其 内 部 的 复杂 结构 ， 

第 四 章 ， 用 多 重 分 形 消 除 趋 势 分 析 方法 分 析 沃 尔 玛 股票 指数 日 收盘 价 序列 ， 
得 出 其 具有 较 强 的 多 重 分 形 性 质 ; 然后 分 析 沃 尔 玛 股 票 指 数 日 收盘 价 序列 的 多 重 
分 形 性 质 主要 是 由 哪 一 种 类 型 的 多 重 分 形 决定 的 ， 

第 五 章 , 利用 相 空间 重 构 技 术 , 在 前 人 研究 基础 上 , 改进 混沌 预测 模型 , 对 短 
时 交通 流 时 间 序 列 进行 预测 ,取得 了 较为 满意 的 效果 ， 
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2 多 重 分 形 理论 


自 19 世纪 股票 市 场 建立 以 来 , 众多 国内 外 学 者 对 股票 价格 的 波动 规律 及 其 预 
测 进行 了 研究 . 早期 研究 认为 对 数 价格 是 一 布朗 运动 , 收益 是 正 态 的 独立 同 分 布 随 
机 变量 , 然而 对 众多 股票 市 场 的 研究 发 现 , 股票 价格 的 波动 中 存在 着 与 这 一 理论 不 
符合 的 特征 , 如 收益 分 布 的 胖 尾 和 波幅 的 长 相关 性 . 在 1999 Æ, Mandelbrot 指出 ， 
单 分 形 过 程 只 能 抓 住 价 格 波动 的 某 一 特征 , 如 L- 稳定 过 程 (IL-Stable Process) 虽然 
可 以 描述 价格 的 涨 跌 特征 , 但 却 无 法 描述 波幅 的 长 相关 性 , 分 数 布朗 运动 (Fractal 
Brownian Motion) 情况 恰好 相反 . 进一步 ,Mandelbrot AW, 多重 分 形 范畴 的 多 
重 分 形 过 程 可 以 更 加 全 面 地 描述 价格 波动 的 特征 . 


2.1 分 形 理论 


2.1.1 分 形 理论 创立 , 发 展 及 意义 


1973 年 , 美 籍 法 国 数学 家 曼 德 勃 罗 特 (B.B.Mandelbrot) 在 法 兰 西学 院 讲课 时 ， 
首次 提出 了 分 形 几 何 的 概念 . 1977 F, 曼 德 勃 罗 符 出 版 第 一 本 著作 《Fractal: Form, 
Chance and Dimension》， 标 志 着 分 形 理论 的 正式 诞生 . 1982 4, «The Fractal 
Geometry of Nature) 出 版 , 标志 着 分 形 论 的 初步 形成 . 


自 诞生 之 后 ,分 形 理论 得 到 迅速 的 发 展 和 广泛 的 应 用 ,已 涉及 自然 科学 、 社 
会 科学 . 经 济 科 学 、 思 维 科学 等 各 种 领域 . 如 今 , 分 形 和 分 维 的 概念 早已 从 最 初 的 
形态 上 具有 自 相似 性 的 几何 对 象 这 种 狭义 分 形 ， 扩展 到 了 结构 、 功 能 、 信息、 时 
得 等 具有 自 相似 性 的 广义 分 形 . 在 此 基础 上 进一步 提出 了 分 形 方法 论 , RAFE 
要 包括 如 下 两 点 : 第 一 , 以 分 形 客体 的 部 分 和 整体 之 间 的 自 相似 性 为 锐利 的 武器 ， 
通过 认识 部 分 来 映 象 ( 即 反映 和 认识 ) 整体 ,以 及 通过 认识 整体 来 把 握 和 深化 对 部 
分 的 认识 ; 第 二 , 运用 分 形 理论 的 思想 和 方法 ,从 无 序 中 发 现 有 序 , 揭示 复杂 、 破 
BE. 混沌 等 极 不 规则 的 复杂 现象 内 部 所 蕴含 的 规律 . 


分 形 理论 及 分 形 方法 论 的 提出 有 着 极其 重要 的 科学 方法 论 意 义 , 它 导 致 了 科 
学 思想 、 科 学 思维 方式 和 科学 方法 论 的 深刻 变革 ,为 人 们 认识 世界 提供 了 新 的 视 
角 和 新 的 思路 . 它 打破 了 整体 与 部 分 、 混乱 与 规则 、 有 序 与 无 序 , 简单 与 复杂 、 有 
RAR. 连续 与 间断 的 隔膜 , 找到 了 它们 之 间 相 互 过 渡 的 媒介 和 桥梁 ( 即 整 体 与 
部 分 之 间 的 相似 性 ), 为 人 们 从 混沌 与 无 序 中 认识 规律 和 有 序 、 从 部 分 中 认识 整体 
和 从 整体 中 认识 部 分 、 从 有 限 中 认识 无 限 和 通过 无 限 深化 和 认识 有 限 等 提供 了 可 
能 和 根据 ; 它 同 系统 理论 、 自 组 织 理论 ,混沌 理 论 等 研究 复杂 性 的 科学 理论 一 起 ， 
共同 揭示 了 整体 与 部 分 、 混乱 与 规则 、 有 序 与 无 序 、 简单 与 复杂 、 有 限 与 无 限 、 连 
续 与 间断 之 间 多 层面 、 多 视角 、 多 维度 的 联系 方式 , 使 人 们 对 它们 之 间 关 系 认识 
的 思维 方式 由 线性 发 展 到 了 非 线 性 阶段 . 
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现在 , 分 形 理论 及 其 方法 作为 一 个 有 力 的 工具 正在 被 人 们 用 于 各 个 领域 的 研 
究 . 近 10 多 年 来 , 分 形 应 用 到 对 金融 市 场 的 研究 ， 已 得 到 极其 迅速 的 发 展 和 肯 
Æ. 


2.1.2 ”什么 是 分 形 


什么 是 分 形 ? 到 目前 为 止 我 们 还 无 法 给 出 一 个 确切 的 定义 .分形 是 一 种 粗糙 
的 或 破碎 的 几何 图 形 , 它 的 组 成 部 分 可 以 被 无 限 细 分 , 而 且 它 的 局 部 的 形状 一 般 
与 整体 相似 。 分形 一 般 是 自 相 似 的 和 标 度 不 变 的 .。 曼 德 勃 罗 在 解释 “分 形 ” 一 词 
时 说 ;*“ 我 由 拉丁 语 形容 词 fractus 创造 了 词 “ 分 形 ” (fractal). 相应 的 拉丁 语 动词 
fragere 意味 着 “打破 ' 和 产生 不 规则 的 碎 块 . 从 而 可 见 (对 我 们 的 需要 是 何等 地 
合适 1), 除了 ' 破 碎 的 ? {如 像 碎 片 或 曲折 ), fractus 也 应 当 具 “不 规则 ， 的 含义 ， 
这 两 个 含义 都 被 保存 在 碎片 (fragment) P”. 许多 数学 结构 是 分 形 , 例如 : 谢 尔 
RRA. 科 切 雪花 、 皮 亚 诺 曲线 、 曼 德 勃 罗 集 、 洛 仑 兹 吸引 子 等 . 分 形 同 样 
可 以 描述 许多 真实 世界 的 对 象 , 如 云彩 、 山脉 、 满 流 和 海岸 线 等 ,当然 它们 不 是 单 
纯 的 分 形 形 状 . 虹 德 勃 罗 曾 给 出 了 一 个 分 形 的 数学 定义 :一 个 几何 对 象 ， 它 的 察 
斯 道夫 维 数 严格 大 于 其 拓扑 维 数 . 这 不 仅 有 些 抽象 ,， 而且 也 不 是 一 个 令 人 满意 的 
EX, 因为 还 有 好 多 分 形 , 没有 被 该 定义 涵盖 . 后 来 曼 德 勃 罗 又 给 出 了 一 个 比较 
通俗 的 定义 ， 部 分 与 整体 以 某 种 形式 相似 的 形 . 该 定义 仍然 不 能 表达 分 形 的 全 部 
意思 ,但 会 使 很 多 初学 者 开始 理解 分 形 了 ， 虽 然 还 不 能 全 部 理解 . 那么 究竟 什么 
是 分 形 呢 ? 应 该 说 , 到 目前 还 没有 严格 的 定义 . 现在 一 般 用 法 尔 科 内 日 对 分 形 集 
合 F 的 描述 来 判 某 一 对 象 是 否 是 分 形 : 

(1) F 具有 精细 的 结构 , 即 是 说 在 任意 小 的 尺度 之 下 , 它 总 有 复杂 的 细节 ， 

(2) F 是 如 此 的 不 规则 ,以 至 它 的 整体 和 局 部 都 不 能 用 传统 的 几何 语言 来 描 
述 ; 

(3) F 通常 具有 某 种 自 相似 性 , 这 种 自 相似 性 可 以 是 近似 的 ， 也 可 能 是 统计 
意义 上 的 ; 

(4) F 在 某 种 意义 干 的 分 形 维 数 通 常 都 大 于 它 的 拓扑 维 数 ; 


(5) 在 多 数 令 人 感 兴趣 的 情形 下 , F 以 非常 简单 的 方法 定义 , 或 许 以 递归 过 
H E. ; 


由 于 难以 直接 对 分 形 进行 精确 的 定义 , 因此 , 往往 从 分 形 所 具有 的 主要 特征 
对 其 做 深入 的 刻画 . 分 形 具有 如 下 性 质 站， 


(1) 自 相 似 性 质 
(2) 标 度 不 变性 
(3) 分 形 维 


(4) 局 部 随机 性 和 整体 确定 性 共存 
2.2 ”多重 分 形 的 一 般 理论 


多 重 分 形 也 称 为 分 形 测 度 . 它 是 研究 一 种 物理 量 在 一 个 支撑 (support) 集合 
上 的 分 布 状况 ， 换 名 话说， 是 定义 在 分 形 上 的 多 个 标 度 指数 的 奇异 测度 所 组 成 的 
集合 , 它 定量 刻画 了 分 形 测度 在 支撑 集 上 的 分 布 ,然后 用 广义 分 形 维 数 或 多 重 分 
形 谱 进 行 描述 , 得 到 的 结果 包含 了 许多 被 单 分 形 忽略 的 信息 BA, 


2.2.1 多 重 分 形 的 有 关 定义 


HOR 是 d 维 欧 式 空 间或 度量 空间 , FER 的 一 个 d ATR, CEWE u 
的 支 集 , 若 在 某 种 划分 下 , (F u) 产生 的 分 形 集 可 以 表 成 若干 分 形 子 集 的 并 , 且 每 
一 分 形 子 集 有 不 同 的 分 形 维 数 , W (F u) 称 为 多 重 分 形 . 

把 研究 对 象 (Fu) 划分 为 N 个 尺度 最 大 为 e 的 单元 5S;(i = 1,2,---,N), 设 
ri 是 5; 的 线 度 大 小 ,Pi 为 5; 的 测度 (例如 概率 或 质量 ), BL, Pi = 1. 对 不 同 
的 单元 P 可 能 也 不 同 , 可 用 不 同 的 标 度 指 数 as 来 表征 , 即 


P, xr, i=1,2,---,N, 


这 里 称 a; A Lipschitz-Holder 指数 (简称 Holder 指数 ), 由 于 它 控制 着 概率 密 
度 的 奇异 性 , 故 也 称奇 异性 指数 , 若 线 度 大 小 趋 于 零 , 则 上 式 化 为 : 


a, 与 所 在 的 区 域 有 关 ,， 它 反映 了 该 区 域 概率 的 大 小 . 若 在 研究 对 象 上 的 测度 是 均 
Sy}, 则 Holder 指数 只 有 一 个 值 , 例如 三 分 Cantor 集 上 的 质量 , 车 已 = 0.5, 则 
ry =e=(§5)" 时, P(e) = (G), 可 得 au =In2/n3, 若 不 均匀 ,得 到 的 Hilder 指 
ARE, 例如 图 1.1 中 P = 0.4, 最 小 概率 子 集 为 (0.40 ,0.41, 0.42, 0.48……)， 对 应 
的 Holder 指数 为 In2/In3, 这 是 Holder 指数 的 最 大 值 , 即 最 大 H6lder 指数 对 应 
最 小 概率 子 集 ; 最 大 概率 子 集 为 (0.6?,0.61, 0.62,0.63,...), 对 应 的 Holder 指数 为 
ln ž/m}, 这 是 Holder 指数 的 最 小 值 , 即 最 小 Holder 指数 对 应 最 大 概率 子 集 . 

得 到 Holder 指数 a 后， 我们 可 以 把 研究 对 象 划分 为 一 系列 子 集 ， 使 得 每 一 
个 子 集中 的 小 单元 都 具有 相同 的 a 值 ， 然 后 计算 这 个 子 集 内 的 线段 数 或 单元 数 
Nale), 定义 Nale) 和 的 关系 式 为 ， 


Nale) x 19, € +0, 


由 此 可 得 ， 
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与 分 形 维 数 的 定义 相 比 可 看 出 , f(a) 的 物理 意义 是 表示 具有 相同 a 值 的 子 集 的 分 
CER, 一 般 称 为 多 午 分 形 谱 . 一 个 复杂 的 分 形体 ， 它 的 内 部 可 以 分 为 一 系列 不 
同 a 值 所 表示 的 子 集 , f(a) 就 给 出 了 这 一 系列 子 集 的 分 形 特征 ， 


f(a) 是 描述 多 重 分 形 子 集 维 数 的 连续 谱 , 如 果 研 究 对 象 是 单 分 形 的 , 则 f(a) 
为 一 定 值 ; 如 果 研 究 对 象 是 多 重 分 形 的 , W fla) 一 般 为 单 峰 图 像 。 


a ~ f(a) 是 描述 多 重 分 形 局 部 特征 的 一 套 基 本 语言 . AE a~ Dla) 语言 
是 从 信息 论 角度 引入 的 . 我 们 定义 统计 和 矩 函数 


M(e,q) = 3 P} (e), (2.2.1) 
i=l 

其 中 g € (—00, 00) WAIE (order)， 是 表征 多 重 分 形 不 均匀 程度 的 量 . 这 
里 规定 0° = 0. 需要 指出 的 是 , 定义 M(e g) 的 目的 是 显示 函数 Pile) 值 的 大 小 。 
从 上 式 可 以 看 出 , 假设 Pale) > P(e). 当 g > 1 时 , ELE, PO 求 和 中 ， 显 
然 是 Pile) 起 主要 作用 , 这 时 M({e,g) 反映 的 是 概率 高 (或 稠密 ) 区 域 的 性 质 . 所 
以 在 4 一 00 的 情况 下 , 可 只 考虑 P(e) 的 最 大 值 而 忽 路 其 它 小 概率 值 , 这 就 简化 
T M(e,q) HHH. 反之 , 当 4< 一 1 时 , M(e, gq) 反映 的 是 分 布 中 概率 较 小 (或 稀 
Ht) 区 域 的 性 质 . 这 样 , 通过 加 权 处 理 , 就 把 一 个 复杂 的 过 程 划 分 为 具有 不 同 奇 蜡 
程度 的 区 域 来 研究 ， 

对 于 一 给 定 的 阶 q, 称 满足 M(e,q) x erg 的 函数 7(9) 为 配 分 函数 (Partition 
Punction)， 它 是 分 形 行为 的 特征 函数 . 若 7(g) 关于 9 是 一 条 直线 , 则 研究 对 象 是 
单 分 形 的 ; E r(9) 关于 4 ERK, 则 研究 对 象 有 多 重 分 形 特征 . 

广义 分 形 维 数 由 Grassberger, Hentschel 和 Procaccia 引入 , 定义 如 下 ， 


zia) q#1, 
DO=1" panyeda (2.2.2) 
limao 一 一 RN 一 4=1 
广义 分 形 维 数 Dla) 随 不 同 的 ¢ 值 而 有 不 同意 义 的 分 形 维 数 ， 

多 重 分 形 是 一 个 由 有 限 几 种 或 大 量具 有 不 同 分 形 行为 的 子 集合 得 加 而 组 成 的 
非 均匀 分 维 分 布 的 奇异 集合 , 因此 它 是 原始 分 形 概念 对 于 非 均匀 分 形 的 自然 推广 


利用 这 个 概念 , 我们 能 分 层次 地 了 解 分 形 内 部 的 精细 结构 , 
2.2.2 ”多 和 置 分 形 参量 的 基本 性 质 
广义 分 形 维 数 与 多 重 分 形 谱 之 间 满 足 勒 让 德 (Legendre) 变换 : 


{ ala) = (2.2.3) 
f(a) =q: ala) ~ 7(9) 


上 式 构成 了 多 重 分 形 的 理论 核心 , 建立 了 独立 变量 g 、T 及 独立 变量 a 、f 之 间 
的 联系 , 不 论 是 哪 两 个 作为 独立 参数 都 可 以 描述 多 重 分 形 内 部 结构 ， 
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性 质 1。 取 值 范围 : 

(1) D(a) > 0(vg E R); 

(2) f(a) >0, Æ a= ao 处 取 最 大 值 , 即 它 的 最 大 值 faz = f(a0); 

(3) ”使 f(a) > 0 的 Holder 指数 a 的 取 值 区 间 记 为 lamin, ama) HP 
Onin = ata) 一 +ooy Omar = aa) 一 -co。， 

dq j9 dq 14 

性 质 2. 单调 性 和 凸 性 ， 

(1) 广义 分 形 维 数 Dla) 和 奇异 性 指数 ala) 关于 4 严格 单调 递减 ; 

(2) 配 分 函数 r(g) 是 关于 q 的 严格 递增 的 凸 函数 ; 

(3) 多 重 分 形 谱 函 数 f(a) 是 关于 a 的 凸 函数 ， 
性 质 3. 特殊 点 的 值 ， 

( D(0) 是 容量 维 数 ，DP(1) 是 信息 维 数 , D2) 是 关联 维 数 ; 

(2) 《= 0 时 , f(a) KEKEE fna = D(0), 是 容量 维 数 ;g = 1 时 , f(a(1)) = 
o(1) 是 信息 维 数 ， 


北京 交通 大 学 硕士 学 位 论文 3 股票 时 间 序 列 的 多 重 分 形 分 类 


3 ”股票 时 间 序 列 的 多 重 分 形 分 类 


近 几 年 来 ， 随 着 分 形 几何 理论 应 用 研究 的 深入 , 仅 使 用 分 形 维 数 描述 证 券 市 
场 交易 数据 波形 ， 只 能 得 出 波动 形态 的 宏观 概 魏 , 无 法 对 其 进行 精确 的 分 析 和 刻 
E, 而 采用 多 重 分 形 则 可 以 研究 交易 数据 在 分 形 子 集 的 分 布 . 对 于 非 均匀 的 现象 ， 
当 一 个 维 数 无 法 描述 其 全 部 的 细致 特征 时 ， 需要 用 多 重 分 形 的 连续 谱 来 表示 四. 
由 于 分 形 理论 在 金融 市 场 中 表现 出 潜在 的 应 用 前 景 , 逐渐 引起 国内 外 学 者 对 金融 
时 间 序 列 分 形 特征 研究 的 浓厚 兴趣 . 例如 , Lo 对 股票 市 场 的 研究 ; SAR, E 
明 涛 e 对 中 国 股票 市 场 的 研究 , 这 些 学 者 均 限 于 对 金融 时 间 序 列 的 单 分 形 过 程 研 
究 , 即 用 一 个 参数 刻画 出 时 间 序 列 在 不 同时 间 尺 度 上 的 分 形 特征 . 鉴于 前 人 研究 
的 基础 上 ,本 节 采 用 多 重 分 形 分 析 的 方法 ,进一步 考察 金融 市 场 时 间 序 列 , 我 们 
借助 短 谱 分 析 、 统计 和 矩 函 数 和 多 重 分 形 谱 函数 这 三 种 方法 对 香港 恒生 指数 日 收盘 
价 进 行 研究 ,得 出 其 具有 较 弱 的 多 重 分 形 性 质 . 这 将 为 多 重 分 形 在 金融 理论 方面 
的 研究 提供 重要 的 理论 基础 . 


3.1 数据 描述 


香港 恒生 指数 是 香港 股票 市 场 上 历史 最 久 、 影 响 最 大 的 股票 价格 指数 ,由 香 
港 恒生 银行 于 1969 年 11 月 24 日 开始 发 布 , 占 香港 股票 市 值 的 63. 8% . 因 该 股 
票 指数 涉及 到 香港 的 各 个 行业 , 具有 较 强 的 代表 性 , 不 论 股票 市 场 狂 升 或 猛 暴 , 还 
是 处 于 正常 交易 水 平 , 它 基 本 上 能 反映 整个 股市 的 活动 情况 ， 所 以 我 们 选取 1992 
年 1 月 2 日 至 2005 年 6 月 27 日 共 3335 天 的 香港 恒生 指数 日 收盘 价 作为 研究 对 
象 , 其 实际 波动 图 如 图 3.1, EPERERA, 纵 坐 标 表 示 收 盘 价 . 原始 数据 来 
自 http://cn.finance.yahoo.com 网 站 ， 


goo 1000 1500 2000 2500 3000 3500 
t 


图 3.1 人 恒生 指数 日 收盘 价 波动 图 
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3.2 ”股票 指数 的 一 般 多 重 分 形 分 析 


在 过 去 几 十 年 里 , 分 形 已 广泛 应 用 于 时 间 序 列 的 研究 , 根据 分 形 相关 理论 来 
确定 时 间 序 列 的 分 形 性 , 例如 , 一 个 随机 过 程 的 谱 若 满足 宕 律 形式 ,说 明 它 具 有 
无 标 度 性 ; 统计 算 函 数 能 确定 分 形 的 存在 性 和 判断 一 个 随机 过 程 为 单 分 形 还 是 多 
BRE, 多 重 分 形 谱 函 数 可 说 明 多 重 分 形 性 质 的 强 弱 ， 


3.2.1 和 帮 谱 方法 
竺 谱 是 研究 分 形 的 重要 工具 ,对 于 时 间 序 列 {X(t) : t € [0, 了}, FRERE 
的 Fourier 变换 的 模 的 平方 BD 
T 
E(w) = HE eN 
t=1 


如 果 谱 或 者 谱 的 一 部 分 遵循 吞 律 形式 
E(w) xw? 


其 中 w 是 频率 , 等 于 时 间 的 倒数 , 是 指数 (又 称 宪 谱 指数 )， 那 么 我 们 把 满足 等 
律 的 频率 区 间 及 相应 的 时 间 区 闻 称 为 无 标 度 区 间 (分 形 关 系 成 立 的 尺度 区 间 ). 在 
无 标 度 区 间 内 , 研究 对 象 具有 无 标 度 性 . 所 谓 的 无 标 度 性 , 就 是 自 相似 性 , 即 局 部 
与 整体 在 形状 、 性 质 或 功能 等 方面 是 自 相 似 的 . 


-5 -4 
log(w) 


3.2 log E(w) ~ logw 关系 图 


根据 短 谱 的 定义 , 我 们 利用 matlab 编程 , Fb AER A RO ES 
频率 之 间 的 关系 , 图 3.2 是 log E(w) ~ logw KAM. 可 以 看 出 在 时 间 区 间 1 ~ 100 
KA, 千 谱 符合 禾 律 形式 E(w) x w?, 估 测 价格 波动 低频 率 值 8 ~ 1.8373, 在 这 
一 时 间 段 内 ， 表 现 出 恒生 指数 日 收盘 价格 的 无 标 度 性 . 因此 以 下 的 统计 和 矩 函数 都 
是 在 长 度 小 于 100 天 的 无 标 度 区 间 内 分 析 的 ， 
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3.2.2 ”统计 和 矩 方法 


设 要 研究 的 时 间 序列 为 {X(t) : t € [0,7]}. 首先 把 时 间 区 间 [0,7] 分 割 成 一 
些 不 相交 的 子 区 间 , 设 和 为 子 区 间 长 度 与 总 区 间 长 度 之 比 的 最 大 值 ，M 为 整个 区 
间 内 的 价格 总 和 , 即 
M=} X(t) 
t€[0,7] 
N(Q,i) 为 第 i PDEA RAEA, 则 第 i 个 小 区 间 内 的 平均 密度 可 表示 为 


(i) = Md) 


对 函数 e( 和 ,i) 加 权 求 和 , BST mH 
M(A,q) = X (à, i)" (3.1) 


规定 0" = 0. 

需要 指出 的 是 , 定义 M(X,9) 的 目的 是 显示 函数 e( 和 ,i) 值 的 大 小 的 作用 . 从 
(3.1) 式 可 以 看 出 , 假设 第 m 个 和 第 j 个 小 区 闻 的 平均 密度 函数 分 别 为 (A, m) M 
e(A, j) B (à m) > elà, j). 4 > 1K, Æ Eeli 求 和 中 ,显然 是 eA m) 
起 主要 作用 , 这 时 M( 和 ,g) 和 Dla) 反映 的 是 稠密 区 域 的 性 质 . MRE 4 一 oo 的 
极限 下 , 可 只 考虑 cA, m) 的 最 大 值 而 忽略 其 它 的 小 值 , 这 就 简化 了 计算 M(X, 9)， 
反之 , 当 g 多 1 时 ，M(X,9) 反映 的 是 分 布 中 稀疏 区 域 的 性 质 .。 所 以 , 通过 加 权 处 
理 , 就 把 一 个 复杂 的 随机 过 程 划分 为 具有 不 同 奇异 程度 的 区 域 来 研究 . 


> o ooo 
0 o 9 ooon 


K X XX XX EK IOMODODOSETONN 


o 
o 
kai 
+ 
2 
v 
k 
可 


图 33 M(Ng) ~ 入 双 对 数 关系 图 ，g =0.0,0.5,...,4.5; 


着 统计 和 矩 具有 如 下 形式 
M(A,q) x A" 


其 中 rla) 是 关于 g 的 函数 , RINKS AM GR (Partition Function), 如 果 r(q) 
是 g 的 非 线性 函数 , 则 时 间 序 列 是 具有 多 重 分 形 的 性 质 ; 如 果 r(g) 是 9 的 线性 函 
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数 ， 则 对 应 的 随机 过 程 是 单 分 形 过 程 . 这 为 我 们 探究 股票 市 场 价格 的 波动 提供 了 
一 种 强 有 力 的 分 析 工具 . 从 这 个 定义 出 发 ， 可 以 先 计 算出 每 个 g 对 应 的 7(gq) É, 
然后 通过 检测 7(9) g 的 非 线性 关系 来 检验 随机 过 程 {X(t)} HAE. 

图 3.3 描述 的 是 q WME M(X, 9) 与 入 的 双 对 数 关系 图 像 , 分 割 成 的 小 区 间 长 
度 范围 是 从 1 天 (A = 0.00029985) 到 25 天 (A = 9.0074963), 妇 图例 所 示 , Æq 
取 值 为 0.0, 0.5, 1.0, .…., 4.5 时 , 在 无 标 度 区 间 内 近似 直线 . 这 对 于 高 阶 矩 q 取 值 
为 -50, -35, ..., 100 时 也 成 立 , 仍然 有 较 好 的 线性 性 质 . 


a8 


图 3.4 r(q) ~g 关 系 图 


图 3.5 Dia) ~g 关 系 图 


由 配 分 函 孝 的 定义 ，r(g) 可 以 根据 r(9) = lim “ERO 得 到 ,因此 , 我 们 通 
过 拟 合 M(A,g) 与 和 的 双 对 数 函数 ， 所 得 直线 的 斜率 就 是 r(9). 图 3.4 表示 的 是 
以 7(q) 为 纵 坐标 和 以 q 为 模 坐标 的 r(9) ~ a 关系 图 (KR), 虚线 是 r(g) HWE 
直线 . 从 图 中 可 以 看 出 r(g) 是 一 个 四 向 横 轴 的 函数 , 7(q) ~ 9 之 间 存 着 非 线性 关 
AK, 这 表明 恒生 指数 日 收盘 价 序列 具有 多重 分 形 性 质 . 
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我 们 再 定义 广义 分 形 维 数 Dg) 为 


a limsa), q#1 
D(q) = | in EO, ig, ls Oo past (3.2) 
显然 D(0) 是 容量 维 赦 。 

由 方程 组 (3.2) 中 的 两 个 式 子 , 我 们 可 以 计算 出 广义 分 形 维 数 D(q) 的 值 , 用 
图 来 直观 表示 , 如 图 3.5, 表示 的 是 D(g) ~ q 关系 图 . 当 g = 0 时 , 得 出 容量 维 数 
D(0) = 0.9990, 由 图 可 以 看 出 , 随 9 的 增加 Dl) 逐渐 减 小 ,最 后 稳定 在 D(oo) 
的 值 上 , D(co) sx 0.9925, 是 多 重 分 形 的 下 限 , 它 相当 于 股票 价格 较 高 的 那些 点 密 
集 在 某 些 时 间 区 间 的 现象 . 


3.2.3 多重 分 形 谱 方法 


研究 一 个 随机 过 程 的 多 重 分 形 程度 最 好 的 方法 就 是 考查 它 的 奇异 谱 , 奇异 谱 
是 利用 一 种 特殊 指数 来 描述 研究 对 象 子 集 的 分 形 特征 . 对 于 多 重 分 形 谱 的 定义 有 
SHAE, 根据 研究 的 需要 , 我 们 简要 介绍 多 重 分 形 谱 的 如 下 定义 ， 

设 函 数 e( 和 ,i) HEIR e( 和 ,i) x A0, 其 中 ali) Holder 指数 且 取 值 
大 小 和 小 区 间 的 位 置 i 有关, 如 果 对 所 有 的 小 区 间 , ali) 取 值 相同 , 我 们 就 称 研究 
的 随机 过 程 为 单 分 形 ; 否则 ， 称 之 为 多 重 分 形 , 把 具有 相同 a 值 的 小 区 间 的 数 记 
为 NA). 若 

Na(A) x A749 

这 与 单 分 形 公式 Na(A) x 和 A-? 相 比 , UU flo) 表示 具有 相同 a 值 的 子 集 
的 分 形 维 数 . 一 个 复杂 的 分 形体 , 它 的 内 部 可 以 分 为 一 系列 不 同 a 值 所 表示 的 子 
集 , 这样 f(a) 就 给 出 了 这 一 系列 子 集 的 分 形 特征 ,， 称 函数 f(a) 为 多 重 分 形 谱 或 
奇异 谱 ， 

广义 分 形 维 数 D(a) 与 多 重 分 形 谱 f(a) 是 描述 多 重 分 形 的 两 种 基本 语言 , 它 
们 满足 下 述 关系 

pm a 9#1 
g | 7(D，9=1 且 r(g) 可 生 
当 r(q) 与 f(a) 可 微 时 ， 有 如 下 变换 
{ a(g) = R, (3.3) 
f(a) = gq.a(q) - 7(g), 

方程 组 (3.3) 本 质 上 是 勤 让 德 (Legendre) 变换 "I, 它 建立 了 独立 变量 9 和 7 及 独 


立 变量 a 和 f 之 间 的 联系 ,通常 最 容易 求 出 随 9 变化 的 *， 所 以 可 以 用 方程 组 
(3.3) 来 求 得 ala) 和 f(a(q)), 使 得 f(a) 相对 a 的 图 通过 参数 9 来 刻画 ， 
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如 果 研 究 的 随机 过 程 是 单 分 形 的 , 则 函数 f(a) 为 一 定 值 ; 如 果 随 机 过 程 是 多 
重 分 形 过 程 , 则 函数 f(a) 一 般 为 单 峰 图 像 . 使 f(a) > 0 的 区 间 记 为 lamin, Amaz), 
其 中 amin = GD | ro Amar = S| ,oo EL f (Amin) = f (amaz) = 0, 我 们 可 
以 用 三 个 参数 来 描述 随机 过 程 的 多 重 分 形 程度 ,它们 分 别 为 fma = f(a0), ao E 
[Omin Amaz]; 区 间 lamin, Amaz! 的 宽度 W = amaz 一 amini 第 三 个 参数 设 为 B, 用 
最 小 二 次 拟 合 可 求 得 . 具体 方法 如 下 ， 

在 函数 f(a) 取得 最 大 值 处 a 的 取 值 ao 附近 , 用 最 小 二 次 拟 合 法 , 拟 合 的 二 
次 函数 设 为 

fla) = Ala — a9)? + Bla — a9) +C 
其 中 参数 B 表示 谱 曲线 f(a) 的 对 称 性 , 4 B= 0 时 , 谱 曲 线 是 对 称 的 ; 当 B > 0 
时 ,， 谱 曲线 的 峰值 偏 右 ; 当 B < 0 时 , 谱 曲 线 峰 值 偏 左 . 通过 以 上 三 个 参数 对 随 
机 过 程 的 描述 , 说 明 当 f(a) RAKERA, KE [Omin Amar) 的 宽度 W 越 大 及 谱 
曲线 f(a) 对 称 性 越 好 时 ， 随 机 过 程 的 多 重 分 形 性 越 强 ， 


AF (3.3) 提供 了 多 重 分 形 谱 估算 公式 ， 但 是 对 于 离散 的 恒生 指数 日 收盘 价 
格 序列 , 我们 用 fla) = _min (a-q—7(q)) 来 计算 . 图 3.6 表示 的 是 多 重 分 形 
if f(a) ~ a 关系 图 ( 实 线 ), 它 是 一 条 钟 形 的 曲线 ，f(a) 的 最 大 值 在 ao = 0.9998 
处 取得 , 此 时 faz = f(a) = 0.9990, 这 与 容量 维 数 D(0) WS. 从 多 重 分 形 谱 图 
上 还 可 估 测 出 使 f(a) = 0 的 两 个 a 的 取 值 , Omin © 0.8641 与 Omar % 1.2233, 所 
以 W = 0.3592. 这 与 文献 [9 的 结论 (W 值 在 0.5 到 1 之 间 ) 相 比较 , 局 部 Holder 
指数 在 较 小 的 范围 内 变化 . 在 ae 处, 用 最 小 二 次 拟 合 , 可 得 f(a) 的 二 次 拟 合 函 
数 (图 3.6 中 虚线 所 示 ) 为 

f(a) = -31.8309(a — 0.9998)? + 2.7168(a — 0.9998) + 0.8890. 


因此 参数 B = 2.7168, 仍 与 文献 O 的 结论 (B 值 在 -1 与 1 之 间 ) 比较 , 看 出 B 
ERK, fa) 图 像 对 称 性 较 低 . 以 上 ,从 多 重 分 形 方面 对 恒生 指数 的 日 收盘 价 序 
列 的 研究 分 析 ， 最 终结 果 表 明 恒 生 指 数 日 收盘 价 具有 较 弱 的 多 重 分 形 性 质 ， 


1 
0.8 


0.6 


35 0.9 4 1.1 1.2 1.3 
a 


图 3.6 f(a) ~a 关 系 图 
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3.3 数据 分 类 


3.3.1 ”根据 配 分 函数 7(9) 的 拟 合 直 线 的 斜率 进行 分 类 


分 类 过 程 如 下 ， 


1, 首先 要 明确 分 类 的 对 象 . 这 里 ,我 们 对 恒生 指数 按时 间 先 后 顺序 划分 成 若 
FA, 每 一 组 数据 第 一 个 数 假设 为 th 时 刻 的 股票 指数 , 最 后 一 个 数 假设 为 to 时 刻 
的 股票 指数 , ti. to 要 根据 研究 的 目的 选取 , 如 : 如 果 研 究 的 目的 是 预测 , U t, t 
可 取 未 来 时 间 ; 如 果 是 为 了 说 明 短 时 间 股 票 市 场 的 数据 特征 ， 则 th. to 的 时 间 间 
隔 就 需要 取 小 的 值 . 对 于 香港 恒生 指数 , 这 里 选取 的 数据 是 从 1987 年 1 月 2 日 到 
2005 年 11 月 11 H, 除去 周末 及 假日 , 共 4647 个 交易 日 数据 作为 研究 对 象 , 对 股 
票 市 场 进行 分 析 时 , 考察 的 是 收益 率 序列 , 我们 以 三 个 月 ( 记 90 KX) 的 数据 为 一 
组 进行 分 析 , 分 组 后 , 最 后 一 组 数据 不 足 90 个 数 的 组 不 在 研究 的 范围 内 . 


2, 数据 分 组 , 我 们 把 研究 对 象 全 体 数 据 划分 为 51 A, BARA 90 个 数据 ， 
分 别 计算 出 每 一 组 的 7+(q). 


3. 最 后 , 我 们 根据 配 分 函数 (9) 曲线 的 拟 合 直线 的 斜率 进行 分 类 . 每 一 组 数 
据 得 出 +(g) 的 一 个 拟 合 直 线 的 斜率 ( 记 为 一 个 样本 点 ),， 共计 51 个 样本 点 ， 也 就 
是 对 这 51 个 样本 点 进行 分 类 , 


除去 7(9) 拟 合 直线 斜率 的 最 大 值 和 最 小 值 的 两 个 样本 点 外 , 余下 还 有 49 个 
样本 点 分 成 5 类 , 对 每 一 类 分 别 求 出 7(q) 的 平均 曲线 , 如 图 3.7 所 示 . 第 一 类 , 含 
有 9 个 样本 点 , 相对 应 7(q) 的 平均 曲线 几乎 是 直线 , 表现 出 单 分 形 的 性 质 , 这 说 
明 这 一 类 的 数据 可 以 由 一 个 标 度 指数 来 描述 . 第 二 类 含有 11 个 样本 点 , B=, 四 
分 别 含有 10、12 个 样本 点 , 这 三 类 数据 对 应 7(9) 的 平均 曲线 表现 出 明显 的 非 线 
性 关系 , 说 明 对 应 的 数据 具有 较 强 的 多 重 分 形 性 质 . 第 五 类 , 仅 含 有 7 个 样本 点 ， 
这 类 数据 也 表现 出 多 重 分 形 性 质 . 


qq) 


-1000 0 50 
图 3.7 五 类 r(g) 的 平均 曲线 


对 数据 进行 分 类 的 目的 是 为 了 更 细致 地 研究 其 内 部 结构 特征 、 分析 现 有 数据 
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的 波动 情况 、 预 测 未 来 股票 数据 大 体 走势 . 因此 , 对 7(9) 分 类 后 , 我 们 有 必要 分 
析 每 一 类 7(9) 对 应 的 原始 数据 , 图 3.8 给 出 了 原始 数据 平均 收益 率 波动 图 (对 应 
3.7 的 五 类 数据 )， 


0 20 4 ; 80 0 100 0 20 0 a 100 
第 一 类 7(q) 原始 数据 第 二 类 r(q) 原始 数据 
0.02 0.018 
ahi 0.014 
0.016 
0.014 opi? 
Zoo & om 
0.01 oie 
0.008 
ial 0.008 
0000 一 T: , 2 0 0000 二 ,页 有。 100 
第 三 类 ra) 原始 数据 第 四 类 ria) 原始 数据 
0.02, 
0.015) 
2 oo 


ms 
B 
& 
s 
z 
8 


第 五 类 r(9) 原始 数据 
图 3.8 ro) 类 原始 数据 平均 收益 率 波动 图 


3.3.2 根据 多 重 分 形 谱 f(a) 的 宽度 进行 分 类 


多 重 分 形 谱 是 描述 时 间 序 列 分 形 结构 的 一 个 重要 参数 ， 在 这 一 部 分 中 ， 我们 
把 研究 对 象 的 全 体 数据 划分 为 51 个 片断 , 每 个 片断 含有 90 个 数据 (不 足 90 个 数 
据 的 片断 不 在 研究 的 范围 内 ), 然后 去 掉 具有 单 分 形 性 质 的 片断 , 分 别 计算 余下 片 
断 的 多 重 分 形 谱 fla). 最 后 , 我 们 根据 多 重 分 形 谱 f(a) 曲线 的 宽度 对 样本 点 进 


15 


北京 交通 大 学 硕士 学 位 论文 3 股票 时 间 序 列 的 多 重 分 形 分 类 


行 分 类 . 图 3.9 给 出 了 四 类 多 重 分 形 谱 f(a) 的 平均 曲线 , 具体 分 类 关系 如 下 ; 


除去 10 个 片断 的 数据 具有 单 分 形 性 质 外 ,将 余下 的 41 个 片断 分 成 4 类 , 这 
四 类 数据 的 平均 多 重 分 形 谱 曲 线 如 图 3.9 所 示 . 第 一 类 含有 7 个 样本 点 , 多 重 分 形 
谱 的 平均 宽度 为 0.7943, 对 应 的 f(a) 曲线 呈现 单 峰 钟 形 , 表现 出 多 重 分 形 性 质 。 
第 二 类 、 第 三 类 分 别 含有 15、16 个 样本 点 , 多 重 分 形 谱 的 平均 宽度 分 别 为 0.9663 
和 1.1405. 第 四 类 仅 含有 3 个 样本 点 , 对 应 的 f(a) 平均 宽度 为 1.3167. 它们 都 表 
现 出 较 强 的 多 重 分 形 性 质 . 图 3.10 给 出 了 f(a) 类 对 应 的 平均 收益 率 曲线 。 


3.9 四 类 f(a) 的 平均 曲线 


_ ”以 上 讨论 的 是 对 rha) 和 f(a) 进行 分 类 , 其 目的 是 更 细致 地 研究 时 间 序 列 的 

内 部 复杂 的 结构 特征 . 当 给 出 一 个 新 的 样本 ， 我 们 可 以 通过 计算 样本 的 7(q) 和 
f(a) 来 确定 这 个 样本 属于 哪 一 类 , 然后 就 可 以 根据 那 一 类 的 特征 对 数据 进行 建 模 
研究 . 比如 , 如 果 给 定 的 样本 点 接近 线性 性 质 , 我 们 采用 线性 方法 (如 , 回归 模型 ) 
是 必要 的 ; 相反 ,， 若 样本 点 具有 分 形 的 性 质 ， 我 们 就 用 分 形 的 方法 对 数据 进行 研 
究 分 析 ， 
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第 一 类 f(a) 原始 数据 第 二 类 sa) 原始 数据 
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第 三 类 ra) 原始 数据 第 四 类 7(g) 原始 数据 
3.10 f(a) 类 原始 数据 平均 收益 率 波动 图 


3.4 小 节 


本 章 简要 介绍 了 多 重 分 形 有 关 的 理论 方法 ,从 多 重 分 形 的 角度 对 恒生 指数 日 
收盘 价 序列 进行 了 实证 研究 . 在 无 标 度 区 间 1 到 100 RA, git MAA, q) 对 任 
意 的 阶 数 4 的 双 对 数 图 都 是 直线 ,这 表明 了 价格 序列 的 无 标 度 性 . 配 分 函数 ra) 
和 奇异 谱 f(a) 的 估算 结果 均 证 实 了 股票 市 场 具 有 较 弱 的 多 重 分 形 性 质 . 然后 , 根 
据 7(q) 和 f(a) 对 收益 率 序列 进行 分 类 , 通过 7(q) 类 , 我 们 能 够 识别 哪 一 部 分 短 
时 数据 具有 分 形 (或 多 重 分 形 ) 性 质 ; 通过 f(a) 类 ,能 够 知道 这 一 短 时 数据 的 复 
杂 程度 . 对 股票 时 间 序列 进行 分 类 , 在 预测 方面 仅 是 第 一 步 ， 更 多 的 工作 还 有 待 
做 . 应 用 分 形 广 义 维 数 和 多 重 分 形 的 原理 , 对 证 券 市 场 交 易 数据 进行 科学 的 分 析 ， 
无 论 是 对 推动 非 线性 数学 分 析 理 论 在 证 券 期 货 业 的 实际 应 用 , 增强 投资 交易 决策 
科学 化 、 数字 化 和 自动 化 的 程度 , 还 是 对 多 重 分 形 在 金融 理论 方面 的 研究 都 具有 
重要 的 意义 。 
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4 多 重 分 形 消除 趋势 波动 分 析 


本 章 我 们 首先 介绍 并 应 用 了 探索 金融 市 场 的 多 重 分 形 性 质 的 一 种 主要 方法 ， 
多 重 分 形 消 除 趋势 波动 分 析 . 消除 趋势 波动 分 析 (Detrended Fluctuation Analysis, 
简 记 DFA) 具有 比 常 规 的 方法 (如 谱 分 析 、Hurst 分 析 ) 更 大 的 优越 性 ， 它 能 够 给 
出 陷入 在 表面 看 似 非 平稳 时 间 序 列 中 的 长 相关 性 ,同时 可 免除 人 造 的 非 平稳 时 间 
序列 中 的 伪 相关 性 现象 。 


在 过 去 几 年 , 对 金融 时 间 序 列 的 分 析 就 已 经 成 为 研究 的 焦点 , 但 人 们 通常 认 
为 价格 的 变动 是 一 种 随机 过 程 , 直到 最 近 人 们 才 发 现 即使 是 最 具有 竞争 力 的 市 场 ， 
它们 的 价格 变动 也 不 是 严格 随机 的 , 而 是 具有 相关 性 和 可 预测 性 . 特别 是 利用 分 形 
或 多 重 分 形 技术 来 研究 金融 时 间 序 列 , 我 们 将 会 发 现 更 多 有 用 的 信息 . 近 几 年 来 ， 
由 Peng et alll 发 明 的 消除 趋势 涨 落 分 析 方法 Multifractal Detrended Fluctuation 
Analysis(MF-DFA), 已 经 成 为 探测 非 平 稳 时 间 序 列 的 标 度 性 和 长 相关 性 的 重要 工 
A; 它 能 精确 的 量化 非 平 稳 时 间 序 列 的 长 相关 性 A, 这 种 方法 已 经 成 功 应 用 到 
许多 领域 , 如 DNA 序列 O34) 心率 跳动 动力 学 3- 下 、 长 时 间 天 气 预 测 S. z 
层 结构 021) 经 济 时 间 序 列 2223| 及 固态 物理 学 A 等 . 由 于 该 方法 基于 随机 步行 
BY, 对 时 间 序 列 有 一 个 求 和 的 过 程 , 因此 , 它 可 以 避免 人 为 引起 的 时 间 序 列 
的 不 稳定 性 . 在 本 章 中 , 我 们 主要 运用 多 重 分 形 消除 趋势 涨 落 分 析 方 法 ,来 研究 
美国 股票 市 场 上 的 沃尔玛 指数 (WMT) 的 多 重 分 形 性 . 


4.1 MF-DFA 方法 


4.1.1 方法 描述 


设 时 间 序 列 (zs) 六 ; 是 紧 支 集 ， 用 多 重 分 形 消除 趋势 分 析 方法 进行 多 重 分 形 
分 析 的 步骤 如 下 ， 
第 一 , 求 序列 对 于 均值 的 累积 离 差 {Y (i)}: 


Y( = > [z(k)- < z >),i= 1,2,...,N, (4.1) 
k=1 
其 中 <z >= $ Dia Tre 
第 二 : 分 割 序列 {Y(i)} 成 等 长 小 区 间 . 将 序列 {Y0} 分 成 Ne = ipt(N/s) 个 
互 不 重 释 的 小 区 间 , 每 个 小 区 间 均 含有 s 个 数据 . 由 于 N 未 必 整 除 s WA Y (i) 
将 有 一 段 剩 余 , 为 了 使 序列 Y(i) 的 全 部 数据 均 进 入 计算 ,再 从 序列 Y() 的 尾部 
重复 这 一 分 割 过 程 , 于 是 得 到 2N, 个 等 长 小 区 间 , 
B=: 用 最 小 二 次 拟 合法 求 均 方 误差 F?(s,v). 设 yli) 是 第 v 个 小 区 间 的 拟 
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合 多 项 式 , 当 v=1,2,...,NN。 时 , 有 
F%(s,0) = Dre ~1)6+4-w(0} (4.2) 

4 u=N,+1,N,+2,...,2N, “er 
Fo) = F SAYIN -Na+ nl) (43) 


这 里 拟 合 多 项 式 v(i) 可 以 是 一 次 的 、 二 次 的 .三 次 的 , ..., 一 般 记 为 MF-DFAm m 
是 拟 合 多 项 式 的 阶 数 . 
第 四 : 对 于 2N, 个 区 间 , R F2(su) 的 平均 值 , 得 a 阶 波动 函数 F(s), 
2N, 1/4 
Fels) = {zi DFG, or} (4.4) 
$ y=1 


当 g 二 0 时 , 波动 函数 可 以 由 下 式 确定 ， 


2N. 
Ri(8) = espli- 》 [F(s 0} (45) 
5 § v=l 
X q=2 时 , MF-DFA 就 退化 成 DFA, 当 g<0 时 , F(s) 的 大 小 主要 取决 于 小 波 
动 偏差 F?(s,v) 的 大 小 ; 而 当 9 > 0 时 , Fy(s) 大 小 主要 取决 于 大 波动 偏差 到 (sy) 
的 大 小 . 这 样 , 不 同 的 9 就 描述 了 不 同 程度 的 波动 对 五 (s) 的 影响 。 
第 五 : 分 析 Fls) 与 s 的 双 对 数 函 数 , 确定 波动 函数 的 标 度 性 , Fals) 是 9 与 
3 的 函数 , 且 对 于 较 大 的 s, Fs(s) DRAIN, BP 


F,(8) cc s* _ (4.6) 


这 里 ha) 称 为 广义 赫 斯 特 (Hurst) 指数 ， 当 序列 是 平稳 时 间 序列 时 , h(2) =H, 
称 为 Hurst 指数 . 通常 , BABA F(s) 是 3 的 增 函 数 , 作出 log F,(s) X} logs 
的 函数 关系 图 , 求 出 log F,(s) 相对 于 logs 的 变化 斜率 ， 其 斜率 即 为 所 得 的 标 度 
指数 hla). WT F,(s) 有 较 高 的 稳定 程度 , 通常 s 的 取 值 不 超过 N,/4. 当 序列 
(zk) 六 | 为 一 单 分 形 时 , 偏差 F(s, v) 在 所 有 区 间 的 标 度 行为 是 一 致 的 , 从 而 hla) 
独立 于 g 为 一 常数 . 特别 的 ， 当 序列 (2) 不 相关 或 短程 相关 时 ，h(g) = 1/2 
当 h(a) 依赖 于 g 并 且 是 关于 q 的 函数 时 , 序列 (e)a 为 多 重 分 形 . 

然而 , MF-DFA 方法 仅 能 确定 正 的 广义 Hurst 指数 hla) 的 信号 性 质 , 当 hla) 
趋 近 于 0 时 ,信号 表现 出 强 的 道 相关 , 此 时 MF-DFA 方法 不 能 准确 地 确定 信号 的 
性 质 , 这 就 需要 修正 MF-DFA 过 程 . 最 简单 的 方法 就 是 在 MF-DFA 方法 之 前 , 在 
第 一 步 中 两 次 求 累 积 离 差 , 方法 如 下 ， 


fa = YI 一 人 (4.7 


k=1 
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DI FIR MF-DFA 方法 , 我 们 得 到 广义 的 波动 函数 F(s), 

Fi(8) x shg) = ht (4.8) 
对 于 大 的 标 度 , 有 ha) = h(q) +1. 
4.1.2 多 重 分 形 相关 理论 


假设 序列 {r1} 为 长 度 为 N 的 稳定 时 间 序 列 ， 那么 在 用 MF-DFA 方法 分 析 
此 稳定 时 间 序 列 时 , 就 可 以 省 略 第 三 步 的 消除 趋势 过 程 ， 也 就 是 所 谓 的 传统 的 波 
动 分 析 法 ( 简 记 为 FA). 用 FA 方法 进行 分 析 , 此 法 的 第 一 步 、 第 二 步 同 MF-DFA 
方法 , 在 第 三 步 中 方程 (4.2) 改 为 
F2,(s,v) = [Y (ws) — Y((v — 1)s)}? (4.9) 
将 (4.9) RARA (4.4), (4.6) 式 可 得 
1 2Ns 1/q 
fon 》 |¥ (vs) —¥((v— 1)s)} ~ tO (4.10) 
§ v=1 
我 们 考虑 简单 的 情况 , 这 里 假设 N 是 s 的 整数 倍 , 即 N = N/s, 这 样 可 得 


Nfs 


SC Y (vs) — ¥((v— 1)s) ~ e007 (4.11) 
由 方程 (4.1) 可 得 ， 
Y (us) — Y ((v —1)s) = > zh = polo) (4.12) 
指数 7(q) 是 由 函数 Z,(s) KEX: = 
Z,(s) = > Ips(v)|? ~ "© (4.13) 


由 方程 (4.11)、(4.12)、 (4.13) 得 到 
7(9) = gh(g) — 1) (4.14) 
这 样 , 我 们 就 得 到 了 MF-DFA 方法 中 定义 的 广义 Hurst 指数 hla) 与 传统 方法 中 
的 标 度 指数 7(q) 的 关系 . 勒 让 德 (Legendre) 变换 式 ， 
a= 7'(q), 4.15 
a ee Sala 
根据 勒 让 德 (Legendre) 变换 式 和 (4.14) 式 , 得 到 多 重 分 形 谱 f(a) 和 广义 Hurst 
指数 hla) 的 关系 式 
f(a) =ala~ h(a] +1 
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4.2 数据 分 析 及 实验 结果 
4.2.1 数据 描述 


沃尔玛 指数 是 美国 股票 市 场 上 历史 最 久 、 影 响 最 大 的 股票 价格 指数 之 一 , 这 
里 选取 的 数据 是 从 1972 年 8 月 25 日 到 2006 年 4 月 27 日 , 除去 周末 及 假日 , 共 
8498 个 交易 日 数据 作为 研究 对 象 . 对 股票 市 场 进行 分 析 时 , 考察 的 是 收益 率 序列 ， 
首先 将 市 场 日 收盘 价 指数 Pe 转化 为 收益 率 序列 re: 


r =n Py - nP, (4.17) 


其 中 t= 1, 2, 3, rage N a 1, P, 是 股票 市 场 在 第 t 个 交易 日 的 收盘 指数 ， Ti 为 股票 
市 场 的 日 收益 率 , 当 收 盘 指 数 波动 较 小 时 ， 对 数 收益 率 近 似 地 等 于 价格 指数 的 百 
分 比 变化 率 , 对 应 着 股票 市 场 的 整体 日 收益 水 平 ， 


-0.6 


0.771000 2000 3000 4000 5000 6000 7000 8000 9000 
t 


图 4.1: 对 数 收益 率 序列 r 随时 间 变化 的 关 


Yit) 


Oh ery Seen rn gee es eT et 
图 4.2: 累积 离 差 Y(t) 随时 间 变 化 的 关 


图 4.1 给 出 了 沃尔玛 指数 收益 率 序列 r 随时 间 变化 的 关系 . 注意 到 在 收益 率 
时 间 序 列 当中 曾 出 现 了 多 个 异常 的 峰值 , 这 表明 股市 价格 波动 的 突 发 性 和 显著 性 ; 
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另外 ,收益 率 序列 中 的 一 些 异常 波动 出 现 了 明显 的 聚 类 现象 ， 这 表明 时 间 序列 的 
波动 具有 条 件 异 方差 迹象 ,可 以 认为 这 些 序列 当中 的 扰动 不 是 白 噪音 过 程 . 


42.2 ”确定 多 重 分 形 性 质 


图 42 给 出 了 收益 率 序列 对 于 均值 的 累积 离 差 Y(t) 随时 间 变 化 的 关系 .从 
图 中 可 以 看 出 来 , 在 不 同 的 时 间 间 隔 期 , 序列 Y(t) 的 变化 趋势 大 不 相同 ， 有 时 上 
升 、 有 时 下 降 , 这 些 上 升 、 下 降 趋 势 有 的 持续 时 间 长 ， 有 的 持续 时 间 短 ; 有 时 幅度 
K, 有 时 幅度 小 . 对 均值 的 累积 离 差 序列 , 分 段 消除 趋势 (MF-DFA1) 后 , 计算 波 
动 函 数值 , 在 双 对 数 图 中 分 析 F,(s) 与 s 的 关系 (如 图 4.3), 其 中 4 的 取 值 分 别 为 
十 4.0, +2.0, 十 0.2, 一 0.2, 一 2.0, —4.0. 从 图 4.3 可 以 看 出 波动 函数 F(s) 与 s 的 双 对 
数 满足 车 律 关系 . 图 4.4 给 出 了 在 拟 合 区 间 s 取 值 为 10 ~ 2000, 广义 Hurst 指数 
hq) 与 4 的 关系 , 从 图 中 可 看 出 , ha) 显著 的 依赖 于 q, HAMA q 值 的 增 大 而 
减 小 , 这 表明 收益 率 序列 具有 多 重 分 形 性 质 . 


log(Fa(s)) 


logis) 
图 4.3: Fy(s) 与 0 的 关系 双 对 数 图 


h(q) 


o 5 
q 


图 4.4: 广义 Hurst 指数 h(a) 5 q 的 关系 图 
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-5 o 8 
9 


4.5: 7(g) ~ q 的 关系 图 


图 4.6: 多 重 分 形 谱 f(a) ~ a 关系 图 (RR) 


根据 (4.14) A, 由 广义 的 Hurst 指数 hla) 可 以 得 到 配 分 函数 rla) 与 4 HK 
R, 如 图 4.5 所 示 . 图 4.5 表示 的 是 以 r(9) 为 纵 坐 标 和 以 9 为 横 坐 标的 ra) ~ 4 
的 关系 图 . 从 图 中 可 以 看 出 7(q) 是 一 个 四 向 横 轴 的 函数 曲线 , r(g) ~ 9 之 间 存 在 
明显 的 非 线性 关系 , 这 表明 WMT 指数 收益 率 序列 具有 较 强 的 多 重 分 形 性 质 . A 
子 (4.16) 提供 了 多 重 分 形 谱 的 估算 公式 , 但 是 对 于 离散 的 WMT 指数 收益 率 序 列 ， 
我 人 用 f(a) = min (a.4 一 7(q)) 来 计算 . 图 46 表示 多 重 分 形 谱 f(a) ~a 关 
RE (RR), 它 是 一 条 钟 形 的 曲线 ,f(a) 的 最 大 值 在 ao 0.5838 处 取得 ， 从 多 
重 分 形 谱 图 上 可 估 测 出 使 f(a) = 0 的 两 个 a 值 Omin © 0.0203 与 Omar © 1.6546, 
所 以 多 重 分 形 谱 的 宽度 W = Omnin 一 Omar = 1.6343, 在 ao Sb, 用 最 小 二 次 拟 合 ， 
可 得 f(a) 的 二 次 拟 合 函数 (图 4.6 中 虚线 所 示 ) 为 


F(a) = -1.2601(a — 0.5838)2 + 0.4263(a — 0.5838) + 0.9440 


可 以 看 出 B= 0.4263, BAR), f(a) 图 像 对 称 性 较 好 , 同样 表明 了 WMT 指数 
收益 率 序列 具有 较 强 的 多 重 分 形 性 . 
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43 区 分 两 种 类 型 的 多 重 分 形 


一 般 来 说 , 时 间 序 列 的 多 重 分 形 有 两 种 类 型 ,一 种 是 由 时 间 序 列 的 概率 密度 
函数 产生 的 多 重 分 形 ， 称 为 分 布 多 重 分 形 ; 另 一 种 是 由 序列 的 长 相关 产生 的 多 重 
RE, 称 为 相关 多 重 分 形 . 区 分 这 两 种 多 重 分 形 最 简单 的 方法 就 是 分 析 其 对 应 时 
各 序列 的 随机 打 乱 序列 的 性 质 ， 


如 果 时 间 序 列 的 多 重 分 形 是 由 长 相关 产生 的 ,那么 对 应 随机 打 乱 次 序 的 序列 
表现 出 随机 性 质 ， 即 horusa) = 0.5 (Psur(g) 表示 随机 打 乱 次 序 的 序列 的 广义 
Hurst 指数 ), 如 果 时 间 序 列 的 多 重 分 形 是 由 概率 密度 函数 产生 的 ,那么 对 应 随机 
打 乱 次 序 序列 的 广义 Hurst 指数 依赖 于 4 的 性 质 不 变 . 为 了 更 好 的 确定 这 两 种 类 
型 的 多 重 分 形 , 我 们 考虑 原始 序列 的 波动 函数 F(s) 与 相对 应 的 随机 打 乱 次 序 的 
波动 函数 F (a). 它们 的 比值 具有 如 下 标 度 性 质 外 ， 


F,(s)/ pet (8) ~ -herus la) (4.18) 


如 果 序 列 的 多 重 分 形 仅仅 由 概率 密度 函数 产生 的 , 那么 hla) = hsnuz(q) 且 它们 的 
值 随 a 的 变化 而 变化 ; 另 一 方面 , 如 果 hla) 一 hsnuy(q) #0, 这 表明 时 间 序 列 存在 
相关 性 , FF heol) = hla) — horws(q)( 其 中 pev(9) 表示 相关 指数 ) 的 变化 依赖 于 q, 
则 说 明 序 列 的 多 重 分 形 是 由 相关 性 产生 的 . 如 果 序 列 仅 表现 出 相关 多 重 分 形 ， 则 
Ashus(Q) = 0.5; 如 果 分 布 多 重 分 形 和 相关 多 重 分 形 都 存在 ,， 则 haus 与 hcor(q) 都 
依赖 于 g. 


4 q 取 值 较 大 时 , hshwy(9) GUTH, 甚至 出 现 负 值 , 如 果 再 采用 MF-DFA 方 
法 分 析 数 据 , 结果 将 会 影响 数据 的 实际 性 质 ， 在 这 种 情况 下 , 我 们 用 修正 的 MF- 
DFA 方法 对 随机 打 乱 次 序 的 数列 进行 分 析 . 广义 的 Hurst 指数 honus (a) 随 q 的 变 
化 (+) R h(a) E a 的 变化 (A) 关系 如 图 4.7 所 示 . 从 图 中 可 以 看 出 , 在 9 取 值 范 
EA, hla) 的 值 总 是 大 于 hsnwy(q) 的 值 , hsnwy(q) 依赖 于 q, 且 随 4 值 的 增加 而 减 
小 , 这 表明 沃尔玛 指数 的 多 重 分 形 是 由 概率 密度 函数 产生 的 , 图 4.8 给 出 了 相关 
指数 hcor(q) 与 4 的 关系 , hcor(q) 值 的 变化 明显 依赖 于 q, 这 表明 相关 多 重 分 形 性 
质 的 存在 . 由 图 4.7 和 图 4.8 我 们 可 以 得 出 , 沃尔玛 股票 指数 时 间 序 列 数据 同时 具 
有 分 布 多 重 分 形 和 相关 多 重 分 形 , 但 分 布 多 重 分 形 起 主要 作用 . 
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q 


图 4.7: h(q) ~ gq (A) M harus ~ q (+) 关系 图 


0 
q 


图 4.8: 相关 指数 hoola) 与 4 的 关系 图 


4.9 给 出 了 Tanuf(g) = dhorus l(a) 一 1 曲线 图 . 从 图 中 可 以 看 出 ,Tanuy(g) 是 
4 的 非 线 性 函数 , 且 图 像 曲线 四 向 g 轴 , 这 说 明了 随机 打 乱 沃尔玛 指数 序列 后 , 并 
没有 消除 指数 的 多 重 分 形 性 质 . 图 4.10 是 随机 打 乱 序列 的 多 重 分 形 谱 Fnur(a) 曲 
RA, 多重 分 形 谱 曲 线 图 仍 呈 现 出 单 峰 钟 形 ，fsnoy (a) 的 最 大 值 出 现在 af > 
0.2895, aff N —0.051, atf ~ 1.3732, 谱 宽 度 Wenus = au — ott! = 1.3783, 
在 of"! = 0.2805 处 , 用 最 小 二 次 拟 合 法 , 得 到 氢 合 曲线 如 图 4.10 BRRR, 其 
中 Banus = 1.4641, 通过 比较 原始 序列 的 多 重 分 形 谱 (图 4.6) 和 打 乱 序列 的 多 重 
分 形 谱 (如 图 4.10) 参数 (多 重 分 形 谱 的 最 大 值 、 宽度、 对 称 性 ), 我 们 得 出 打 乱 序 


列 的 多 重 分 形 性 质 弱 于 原始 序列 的 多 重 分 形 性 质 . 
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4.9: Tenus (4) = dhorus (4) 一 1 曲线 图 


图 4.10: 随机 打 乱 序列 的 多 重 分 形 谱 fengsla) 曲线 图 
4.4 小 节 


本 章 利用 多 重 分 形 消除 趋势 分 析 的 方法 (MF-DFA) 分 析 美 国 股票 市 场 中 的 单 
支 股票 指数 - 沃尔玛 指数 . 通过 分 析 广义 Hurst 指数 h(g)、 配 分 函数 7(q) 及 多 重 
分 形 谱 f(a), 得 出 多 重 分 形 消除 趋势 分 析 法 能 够 准确 可 靠 地 确定 时 间 序 列 的 多 重 
分 形 性 质 . 然后 随机 打 乱 时 间 序 列 的 次 序 , 用 MF-DFA 方法 分 析 打 乱 序 列 的 多 重 
分 形 性 质 ， 目 的 是 确定 原始 时 间 序列 属于 哪 一 类 的 多 重 分 形 ， 属 于 分 布 多 重 分 形 
还 是 相关 多 重 分 形 ? 通过 具体 的 分 析 得 出 ， 沃 尔 玛 指数 的 多 重 分 形 主 要 是 由 概率 
密度 函数 产生 的 , 分布 多 重 分 形 占 主 导 地 位 . 比较 原始 序列 和 打 乱 序列 的 多 重 分 
形 性 质 , 得 出 打 乱 序列 的 多 重 分 形 性 弱 于 原始 序列 的 多 重 分 形 性 . 这 一 结果 不 仅 
对 多 重 分 形 在 金融 理论 方面 的 应 用 提供 帮助 ， 而 且 对 股票 市 场 理论 建 模 、 短 时 预 
测 和 管控 策略 的 制定 具有 重要 意义 . 从 而 投资 者 和 融资 者 可 以 及 时 准确 地 掌握 市 
场 行情 , 以 便 做 出 合理 的 决策 ， 
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5 基于 相 空间 重 构 的 交通 流 混沌 预测 


在 智能 化 交通 系统 (Intelligent Transportation of System, 简称 IFS) 中 , ka 
着 现代 交管 模式 由 被 动 管理 到 主动 诱导 的 转变 , 预测 信息 也 越 来 越 重 要 . 时 间 间 
隔 不 超过 15min 的 短 时 间 交 通 流 预测 是 目前 研究 的 热点 . 基于 混沌 的 相 空间 重 构 
技术 能 较 好 的 刻画 交通 流 变化 量 随 机 因素 中 所 包含 的 系统 本 身 内 在 随机 性 即 重 构 
系统 吸引 子 ， 从 而 成 为 当前 交通 流 预测 的 重点 . 由 于 交通 流 所 处 的 环境 受众 多 因 
素 的 影响 ， 是 复杂 的 系统 ,很 难 建立 能 够 全 面 描述 系统 的 动力 方程 跟踪 ， 每 个 变 
量 ， 只 能 把 它 投影 到 某 一 个 平面 或 直线 上 来 观察 ， 从 而 采集 到 的 数据 是 一 维 或 两 
维 的 时 间 序 列 . H.Whitney 提出 的 拓扑 嵌入 理论 和 在 此 基础 上 Takens 和 Packard 
证 明 药 相 空 间 重 构 理论 解决 了 从 这 些 有 限 的 时 间 序 列 数 据 中 获得 整个 系统 动力 特 
性 问题 . 本 章 主 要 是 用 相 空 间 重 构 的 技术 来 预测 交通 流 ， 


5.1 A(R 


已 知 某 交 通 流 变化 量 的 时 间 序列 为 z(1),z(2),… ,z(n)， 其 中 时 间 间 隔 为 A 
t( 单 位 时 间 ), 设 重 构 相 空间 的 柑 入 维 数 为 m 和 时 间 延 迟 为 7， 则 重 构 的 m 维 相 
空间 的 第 i 个 点 坐标 为 


X(i) = [x(i),2(i+7),--- æli + (m — 1)r)] 


其 中 i=1,2,… ,N,N 二 nn 一 (m 一 1)7. 在 重 构 相 空间 中 , 嵌入 维 数 m 和 时 间 延 
Br 是 决定 重 构 相 空间 质量 的 两 个 重要 参数 ， 

本 章 对 采集 到 的 北京 东 三 环 快速 路 某 断 面 的 单 向 交通 流 数据 进行 分 析 , 其 中 
观测 的 数据 时 段 为 2006 年 7 月 17 日 到 2006 Æ 7 H 26 日 每 天 5:00 到 23:00 3 
十 天 的 数据 , 每 2min 采集 一 个 样本 点 , 共 4862 个 样本 点 ， 


5.1.1 HEER 7 的 确定 


时 和 延迟 7 的 选择 不 能 太 小 也 不 能 太 大 . EER r 太 小 ， 相 空间 矢量 
X(i) = [z(i) z(i+r), ,2(i+-(m—1)7)] 中 的 任意 两 分 量 z(t+j7) 和 z(t+(j+1)7) 
在 数值 上 非常 接近 ， 以 至 于 无 法 区 分 ， 从 而 无 法 提供 两 个 独立 的 坐标 分 量 ; 如 果 
时 间 延 迟 r 太 大 的 话 ， 则 两 坐标 分 量 在 统计 意义 上 又 是 完全 独立 的 ,混沌 吸引 子 
的 轨迹 在 两 方向 上 的 投影 毫 无 相关 性 可 信 . 这 就 需要 用 一 定 的 方法 来 确定 一 个 合 
适 的 7 E. 

由 Takens 定理 知 , 在 没有 噪音 无 限 长 的 精确 数据 的 情况 下 , 可 以 任意 选择 r7, 
但 是 实测 时 间 序 列 是 有 限 长 的 ， 且 一 般 都 有 噪音 污染 , 因此 在 重 构 过 程 中 7 的 选 
取 起 着 重要 的 作用 . 一 般 只 能 根据 经 验 来 选取 7, 其 基本 思想 是 使 关 (i) A X(i+7) 
具有 某 种 程度 的 独立 但 又 不 完全 无 关 , 以 便 它 们 能 在 重 构 的 相 空间 中 作为 作为 独 
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立 的 坐标 来 处 理 . 在 实际 应 用 中 , OR 7 的 方法 有 线性 相关 函数 法 和 互信 息 法 , 文 
献 外 提出 了 一 种 有 效 的 求 时 间 延 迟 的 方法 ， 此 方法 是 建立 在 几何 方法 的 基础 上 
的 ， 称 为 重 构 展 开 法 的 最 佳 延迟 时 间 间 隔 选择 法 . 综合 考虑 了 元 余 或 不 相关 之 间 
HT, 在 Lo 范 数 下 定义 平均 位 移 92(rm7) 为 


»(m, 7) Sion) = BS Ss -a (i))? 
4 一 1 =1 


在 Lo 范 数 下 定义 平均 位 移 Solm, T) 为 
N 

Soo(m, T) = we de |[z{i+ Ir) — z(i) 
记 52(m,7T)、Soo(m,7) 为 S(m,7). 平均 位 移 S(m,7) 表示 重 构 状 态 空间 的 轨 线 从 
状态 空间 主 对 角 线 打开 的 程度 ,定量 地 刻 划 了 当 7 增加 时 宛 佘 误差 的 减 小 . 当 r 
增加 时 , S(m,7) 相应 地 增加 , 对 较 大 的 m, ERA T 出 S(m,7) 不 再 增加 ,此 时 
的 7 为 最 佳 延迟 时 间 间 隔 . 这 种 方法 的 优点 是 对 有 噪音 和 小 的 数据 集 比 较 可 信 ， 
而 且 计算 时 间 较 短 ， 

用 重 构 展 开 法 的 最 佳 延迟 时 间 间 治 选 择 法 计算 交通 流 时 间 序 列 的 平均 位 移 
S(m,7) ~ 7 的 关系 曲线 如 图 5.1 所 示 。 从 图 中 可 以 看 出 ， 时 间 延 迟 从 了 = 5 
开始 , S(m,7) 不 再 随 7 的 增加 而 增加 , 因此 我 们 选取 7 = 5 为 重 构 相 空间 的 延迟 
时 间 间 隔 ， 


图 5.1: Smh ~T 的 关系 图 
5.1.2 KAHK m 的 选取 


求 嵌 入 维 数 经 典 的 方法 是 通过 G-P 算法 计算 关联 维 数 (比方 法 是 由 Grass 
berger 和 Procaccis 首先 提出 来 的 ), 但 是 在 此 法 中 计算 关联 积分 比较 费 机 时 . Cao 
提出 了 一 种 计算 嵌入 维 数 的 有 效 方 法 9. 对 时 间 序 列 rli) 及 相 空 间 矢 量 


Xi(m) = [z(i), c(i +7),...,2(¢ + (m— 1)r)] 
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其 中 i= 1,2,...,7n 一 (m 一 1)7, m ERA, 7 是 时 间 延 迟 . 定义 
-y a Gln + 1) - XnGm (m+ 1) |l 
alim) = Tm) Xag (mm) i 
其 中 j= 1,2,… ,n 一 mT, Xml) RAE m+] ASA PR 了 个 重 构 空间 向 量 ， 
例如 Xi(m+1) = (z(J), «(jy +7), a ,a(j+mr)); n(j, m)(1 < nj, m) < n~mr) 
是 整数 ,，Xndm(m) 表示 m 维 相 空 间 中 距离 X;(m) 最 近 的 点 向 量 , 这 个 点 向 量 与 
相 空 间 的 维 数 m 和 点 的 位 置 7 AR. a(j,m) 的 均值 为 


n-mT 


1 
some 2 Him) 


j=l 


E(m) = 


为 了 观测 E(m) 从 m 维 空间 变化 到 m+ 1 空间 时 , E(m) 随 m 值 的 变化 情况 , 我 


们 定义 
E(m +1) 


E(m) 


Ei (m) = 


2 4 6 8 10 12 
m 


图 5.2: Em) 随 m 的 变化 曲线 图 


如 果 E,(m) 自 某 个 mo 开始 停止 变化 , 则 ro 十 1 即 为 所 寻找 的 嵌入 维 数 , 我 
们 用 于 实证 分 析 的 交通 流 时 间 序 列 的 Ey (m) 随 m 的 变化 曲线 如 图 5.2 所 示 . 在 
噪音 存在 的 情况 下 , 从 mo = 6 开始 , Em) ATRE. 因此 , 我 们 取 交 通 流 时 间 
序列 的 相 空间 重 构 维 数 为 m=7, 


5.2 混沌 预测 


在 重 构 相 空 间 的 基础 上 , 我 们 对 交通 流 时 间 序 列 进行 混沌 预测 O89), 用 相 空 
间 重 构 方法 来 预测 时 间 序 列 有 多 种 方法 , 根据 拟 合 相 空 间 中 吸引 子 的 方式 可 分 为 
全 域 法 和 局 域 法 两 种 . 所 谓 的 全 域 法 就 是 将 轨迹 中 的 全 部 点 作为 拟 合 对 象 ， 找 出 
其 规律 ， 由 此 预测 轨迹 的 走向 . 通常 是 根据 给 定 的 数据 构造 映射 ,使 得 逼近 误差 
最 小 . 此 方法 称 为 全 域 法 ， 是 因为 它 考虑 了 问题 的 全 部 ,在 近似 映射 过 程 中 使 用 
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了 相 空 间 中 所 有 的 点 . 局 域 法 是 将 相 空 间 中 的 最 后 一 个 点 作为 中 心 点 ,把 离 中 心 
点 最 近 的 若干 轨迹 点 作为 相关 点 ， 然 后 对 这 些 相关 点 作出 拟 合 ， 在 估价 轨迹 下 一 
点 的 走向 ， 最 后 从 预测 出 的 轨迹 点 的 坐标 中 分 离 出 所 需要 的 预测 值 . 局 域 法 在 大 
多 数 情况 下 适用 . 


我 们 用 想 空 间 重 梅 预测 算法 ,就 是 要 寻找 “历史 上 情况 最 相似 之 处 . 此 方法 
最 早 被 Lorenz 用 于 实际 , 他 通过 分 析 历史 数据 来 预测 天 气 . 这 里 我 们 改进 相 空间 
重 构 的 局 域 法 , 来 预测 交通 流 时 间 序 列 . 预测 模型 为 


多 Lint Xr ex(—U(ds — dmin)) 
DN exp(—I(d; — dmin)) 


Et X 为 预测 的 空间 点 轨迹 ，Xk +1 为 中 心 点 Xi 邻 域 中 各 点 的 下 一 时 刻 的 点 ,N 
为 中 心 邻 域 中 点 的 数目 ; di dmin 分 别 为 邻 域 中 各 点 到 中 心 点 的 空间 距离 和 最 小 
距离 ; | 为 一 参数 , 一 般 选 况 下 ! > 1, 从 上 式 中 可 以 看 出 来 ， 邻 域 中 各 点 到 中 心 点 
的 空间 距离 越 小 , 则 在 预测 中 所 占 的 比例 越 大 . 


取 交 通 时 间 序 列 的 前 4000 个 数据 作为 已 知 样本 ,来 预测 第 4001 个 数据 , Bi 
测 结果 如 图 5.3 所 示 , 实 线 是 真实 值 ， 点 线 是 预测 值 , 


图 5.3: 预测 值 随时 间 变 化 曲线 图 


从 图 5.3 中 可 以 看 出 , 预测 曲线 与 实际 值 吻 合 的 较 好 , 到 达 了 很 高 的 拟 合 度 ， 
平均 相对 误差 为 9.04%， 达 到 了 交通 预测 和 交通 诱导 所 需要 的 的 预测 精确 度 , 但 
是 从 图 中 可 以 看 出 ,在 个 别 点 处 预测 误差 比较 大 , 这 主要 是 因为 采用 的 时 间 序列 
数据 量 少 , 对 于 一 些 相 点 , 找到 的 近邻 离 该 相 点 距离 较 大 , 造成 误差 较 大 . 随 着 时 
间 序 列 长 度 的 增加 ， 相 空间 中 相 点 的 密度 会 增加 ,近邻 选择 会 更 加 合理 ， 这 有 助 
于 提高 预测 精度 ， 
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随 着 非 线 性 科学 的 快速 发 展 , 分 形 科学 的 研究 与 应 用 也 愈 来 愈 备 受 关注 , 其 
原因 可 归结 为 以 下 几 点 : 

(1) 分 形 现象 在 自然 界 的 普遍 存在 性 ， 

(2) 分 形 的 局 部 随机 性 , 决定 了 深入 研究 的 复杂 性 ; 


(3) 分 形 与 其 他 学 科 领 域 的 相互 渗透 ， 因 此 分 形 的 研究 成 果 也 会 带动 相关 学 
科 领 域 的 进步 。 


本 文 首先 实例 分 析 了 香港 恒生 指数 的 多 重 分 形 性 质 , 在 此 基础 上 对 香港 恒生 
指数 分 别 用 多 重 分 形 谱 的 宽度 和 配 分 函数 曲线 的 拟 合 直线 的 斜率 进行 分 类 , 更 进 
一 步 的 研究 复杂 系统 的 内 部 结构 ,为 以 后 的 金融 时 间 序列 的 短 时 间 预 测 提供 了 有 
利 的 帮助 . 针对 金融 市 场 时 间 序列 噪音 大 的 现象 ， 本文 用 消除 趋势 分 析 的 方法 对 
美国 股票 指数 - 沃尔玛 股票 指数 去 噪 分 析 ， 得 出 其 具有 多 重 分 形 特征 ,然后 打 乱 
原始 序列 ， 通 过 分 析 此 打 乱 序列 和 原始 序列 的 多 重 分 形 特征 , 得 出 沃尔玛 股票 指 
数 的 多 重 分 形 主要 是 由 概率 密度 函数 产生 的 ,分布 多 重 分 形 占 主导 地 位 , THE 
列 的 多 重 分 形 性 弱 于 原始 序列 的 多 重 分 形 性 , 这 一 结果 不 仅 对 多 重 分 形 在 金融 理 
论 方面 的 应 用 提供 帮助 ,而且 对 股票 市 场 理 论 建 模 、 短 时 预测 和 管控 策略 的 制定 
具有 重要 意义 . 本 文 最 后 在 相 空间 重 构 的 基础 上 对 交通 流 时 间 序 列 利用 改进 的 模 
型 进行 混沌 预测 , 结果 达到 很 好 的 效果 . 

有 关 分 形 和 混沌 的 研究 无 论 从 理论 上 还 是 从 实际 应 用 上 , 都 有 待 进一步 的 发 
展 与 提高 . 非 线性 系统 的 建 模 与 预测 一 直 是 非 线性 科学 研究 的 重要 内 容 ， 本 文 在 
混沌 预测 中 ,确定 重 构 相 空间 的 维 数 和 时 间 延 迟 至 关 重 要 ,这 两 个 参数 大 小 的 选 
取 直 接 影响 着 预测 的 精确 度 . 如何 更 优化 的 确定 这 两 个 参数 以 及 选择 怎样 的 数学 
模型 还 有 待 于 进一步 的 的 研究 . 
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